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摘要 : [目的 /意义 ] 通 过 调研 国内 外 新 一 代 机 构 知 识 库 的 研究 现状 和 服务 需求 ,分 析 关 键 技 术 和 功能 特 
点 ,提出 发 展 趋势 ,为 建设 新 一 代 机 构 知 识 库 发 展 提供 建议 。[ 方 法 /过 程 ] 通 过 文献 研究 对 机 构 知 识 库 技 术 和 
功能 发 展 趋势 进行 总 结 ， 并 根据 相关 研究 成 果 ， 分 析 新 一 代 机 构 知 识 库 的 11 个 关键 技术 、 标 准 和 协议 。 最 后 通 
过 研究 和 实践 经 验 提 出 新 一 代 机 构 知 识 库 在 框架 、 功 能 服务 目标 等 方面 的 发 展 趋 热 。[ 结果 /结论 ] 新 一 代 机 
构 知 识 库 发 展 趋势 包括 :从 机 构 学 术 仓储 到 机 构 信 息 基础 设施 ;从 自 存档 到 自动 提交 ;从 独立 平台 到 与 科研 管 
理 系 统 融 合 与 发 展 ;从 学 术 成 果 管 理 平台 到 学 术 资 源 服务 中 心 ;从 学 术 成 果 数 据 检 索 到 大 数据 语义 研究 支持 ; 
从 成 果 存 档 到 新 型 学 术 交 流 社 区 ;从 应 用 计量 指标 到 建立 全 新 学 术 评 价 体系 。 
S 关键 词 : 机 构 知 识 库 ”新 一 代 机 构 知 识 库 ”下 一 代 机 构 知 识 库 关键 技术 发 展 趋势 
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开放 获取 运动 推动 下 ,全球 机 构 知 识 库 (Institu- 
tional Repository ,IR ) 发 展 迅 速 ,至 2019 年 3 月 ,在 机 构 
知 调 库 注 册 网 站 (The Directory of Open Access Reposi- 
tortes , OpenDOAR ) 注册 的 机 构 知 识 库 数量 从 2005 年 
12. 8588 个 增加 到 3 996 个 ”… 。 然 而 与 开放 获取 理 
念 的 广泛 接受 、 机 构 知识 库 数量 快速 增长 和 全 球 开 放 
获取 运动 推动 者 的 不 懈 努 力 相 比 ,机 构 知 识 库 在 学 术 
交流 系统 中 仍 未 发 挥 出 期 望 的 价值 ,商业 数据 库 和 商 
业 出 版 依然 是 学 术 交 流 的 主要 渠道 ,开放 获取 打破 学 
术 交 流 商 业 垄 断 的 目标 仍 未 实现 ,全 球 IR 的 质量 和 影 
响 力 仍 存在 巨大 差距 。2016 年 ,IR 最 早 建设 者 与 引领 
者 麻 省 理工 学 院 , 庆 祝 自 该 校 OA 政策 发 布 以 来 ,IR 教 
师 发 表 论 文 存储 率 达 到 44% 。 同 年 ,俄勒冈 州立 大 学 
(Oregon State University) 和 内 布 拉 斯 加 州立 大 学 (Ne- 
braska State University ) 的 IR 存储 率 超 过 40% 。2017 
年 3 月 ,美国 大 学 与 研究 型 图 书馆 协会 ( Association of 
College and Research Libraries, ACRL) 发 布 《2017 环境 
扫描 》 报 告 ” ,其 中 关于 机 构 知 识 库 的 发 展 ,报告 特别 
提出 ,美国 大 学 机 构 知 识 库 一 直 存 在 较 低 存储 率 的 情 


况 。 美 国 大 学 IR 长 期 以 来 ,存储 率 一 直 低 于 50% 。 加 
州 大 学 (The University of California) IR 储存 率 2016 年 
仅 为 23% ,没有 存 缴 政策 支持 的 其 他 美国 大 学 IR 存储 
率 则 更 低 。 而 学 术 交 流 环 境 , 却 在 大 数据 ` 云 计算 dz 
在 网 络 .虚拟 现实 人工 智 能 等 新 技术 广泛 应 用 影响 
下 ,已 经 发 生 改 变 。 新 学 术 交 流 生 态 环 境 下 ,IR 如 何 
发 挥 作用 ,全 球 IR 是 否 能 通过 新 技术 形成 合力 ,IR 如 
何 迎 接 新 挑战 和 新 机 遇 , 新 一 代 机 构 知 识 库 的 研究 和 
构建 成 为 必然 选择 。 

本 文 将 调研 国内 外 新 一 代 机 构 知 识 库 的 研究 现状 
和 服务 需求 ,分 析 新 一 代 机 构 知 识 库 关键 技术 ,提出 新 
一 代 机 构 知 识 库 功能 特点 ,为 建设 新 一 代 机 构 知 识 库 
发 展 提供 建议 。 


2 研究 综述 


2.1 机 构 知 识 库 功能 与 服务 增强 研究 与 实践 

对 IR 功能 扩展 和 提供 增值 服务 的 研究 和 实践 , 国 
内 外 一 直 都 有 积极 的 探索 。 在 中 国 , 马 建 起 ”提出 了 
机 构 知 识 库 在 内 容 建 设 与 服务 设计 方面 的 趋势 ,如 制 
定 强制 存 缴 政策 .采取 灵活 的 访问 策略 简化 存 缴 步 
又 .集成 到 用 户 信息 环境 ` 以 机 构 知 识 库 联 盟 获得 规模 
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优势 .提供 知识 审计 与 能 力 分 析 功能 .长 期 保存 服务 、 
技术 和 服务 团队 的 持久 保障 等 。 张 晓 林 中 针对 机 构 知 
识 库 的 发 展 ,提出 机 构 知 识 库 支持 非 文 本 信息 存储 利 
用 支持 教育 科研 活动 .支持 机 构 战 略 性 知识 管理 三 个 
未 来 发 展 趋 势 以 及 一 系列 可 能 的 服务 功能 。 刘 独 、 视 
忠明 吴志强 等 “研究 内 容 可 视 化 知识 图 谱 , 图 像 检 
索 .影音 资源 支持 .检索 三 维 模 型 等 新 技术 在 机 构 知 识 
库 中 的 应 用 ,提供 增值 服务 。 张 旺 强 等 ”通过 互 操 作 
协议 ,实现 简化 用 户 提交 过 程 ,自动 存档 。 崔 海 垦 
等 "通过 提供 增强 内 容 和 数据 统计 ,设计 更 符合 资助 
机 构 应 用 的 机 构 知 识 库 。 香 港 科技 大 学 机 构 知 识 库 以 
学 者 为 中 心 , 展 示 学 者 成 果 , 并 利用 可 视 化 技术 ,构建 
学 者 的 合作 者 网 络 , 将 学 者 的 Scopus ID , Researcher ID 
和 FORCID 三 者 进行 关联 ,全 方位 展示 学 者 的 学 术 轨 
迹 55 。 香 港大 学 机 构 知识 库 将 论文 与 学 者 、 基 金 项 目 
与 党 者 进行 了 关联 。 香 港 理工 大 学 机 构 知 识 库 在 
Scopus 的 
被 弹 频 次 WoS 的 被 引 频次 访问 次 数 .下 载 次 数 AN- 
metric AS 。 

国际 上 ,对 IR 的 功能 拓展 和 服务 增强 研究 更 为 广 
AIRA o L. Sterman 等 “用 丰富 的 可 视 化 工具 ,提供 
增 叶 的 统计 和 计量 数据 服务 ,并 基于 访问 情况 , 主动 向 
TEE E 服务 。A. Cocciolo' ^ 研究 比较 Web2.0 
应 湖 对 用 户 参 与 IR 的 不 同 ,发 现 应 用 Web2. 0 技术 有 
BP DR POS IR 的 兴趣 与 参与 。J.Richard 提出 
互 操作 如 何 促成 机 构 知识 库 的 发 展 可 能 被 使 用 的 方 
式 坟 及 实现 的 方式 。 机 构 知识 库 与 科研 管理 系统 融合 


IR 基础 上 扩展 实现 ,通过 在 DSpace 的 基础 上 增加 
CRIS 模块 ,实现 了 CERIF 兼容 的 DSpace -CRIS 系 
ao o fex EE] E. ^E pé (King’s College London) [i8] 、 加 
拿 大 皇后 大 学 (Queen 's University)'" 在 科研 管理 系 
统 的 基础 上 ,增加 具有 开放 获取 功能 的 机 构 知 识 库 模 
块 。 圣 安德鲁 斯 大 学 ( Universtiy of St Andrews ) 的 机 构 
知识 库 与 科研 管理 系统 通过 API 的 方式 实现 系统 间 互 
BEP, 
2.2 新 一 代 机 构 知 识 库 相 关 研 究 

2016 年 4 月 ,开放 获取 知识 库 联盟 (The Confeder- 
ation of Open Access Repositories, COAR) 成 立 下 一 代 
知识 库 工 作 组 ,调研 用 户 新 需求 ,提出 新 功能 和 技术 方 
Ro COAR 认为 ,利用 分 布 在 全 球 的 3 000 多 个 知识 库 


机 构 都 能 够 参与 全 球 的 科学 和 学 术 研究 网 络 。 在 知识 
库 网 络 之 上 建立 标准 化 使 用 统计 指标 、 同 行 评议 和 社 
交 网 络 等 附加 服务 ,将 有 利于 机 构 知识 库 发 展 ,改变 商 
业 出 版 商 主导 学 术 传 播 体系 的 现状 ” 。 

2017 年 11 月 ,COAR 发 布 工 作 组 研究 成 果 报告 
“下 一 代 系 统 - 行动 和 技术 建议 ”, 介绍 工作 组 研究 成 
果 ,提出 对 下 一 代 机 构 知 识 库 应 用 新 技术 标准、 协议 
的 建议 ,以 帮助 知识 库 融 入 网 络 环境 ,使 它们 在 学 术 交 
流 生态 系统 中 发 挥 更 大 作用 。 下 一 代 IR 的 建设 目标 
是 :使 知识 库 成 为 分 布 式 的 全 球 网 络 化 学 术 交 流体 系 
的 基础 ,在 此 之 上 提供 各 种 层级 的 增值 服务 ,从 而 变革 
出 版 系统 ,使 其 更 加 以 研究 为 中 心 更 加 开放 并 支持 创 
新 ,同时 由 学 术 界 共同 管理 。 这 一 愿景 的 一 个 重要 组 
成 部 分 ,是 知识 库 将 提供 多 种 研究 成 果 的 开放 获取 , 支 
持 学 术 成 果 广 泛 传播 ,并 使 其 在 研究 评估 过 程 中 得 到 
正式 承认 。 报 告 描述 了 11 项 新 功能 ,以 及 在 知识 库 现 
有 功能 基础 上 开发 包括 社交 网 络 .同行 评议 .通知 和 使 
用 统计 等 新 服务 相关 的 技术 标准 和 协议 ,包括 :中 公 
开标 识 符 ;@ 在 资源 层 声 明 许可 协议 ;@@ 通 过 导航 发 
现 ;@@ 与 资源 互动 (注释 ,评论 和 评述 ) ;名 资源 转移 ; 
@ 批 量 发 现 ;@ 收 集 和 导出 活动 元 数据 ;@ 用 户 识 别 ; 
@ 用 户 认 证 ;@@ 公 开标 准 化 使 用 计量 指标 ;@ 四 长 期 保 
17. 

在 COAR 引领 下 ,对 新 一 代 机 构 知识 库 的 功能 、 技 
术 和 发 展 的 研究 和 应 用 ,成 为 及 领域 的 热点 。 

2018 年 9 月 4 日 ,来 自 法 国 . 英 国 、 荷 兰 、 意 大 利 等 
11 个 欧洲 国家 的 主要 科研 经 费 资助 机 构 , 在 欧洲 研究 
委员 会 (European Research Council, ERC) 的 支持 下 , 联 
合 签署 了 新 的 开放 获取 计划 cOAlition S 计划 (以 
下 简称 “S 计划 ”) 。S 计划 的 核心 原则 是 :“ 从 2020 年 
1 月 1 日 起 ,所 有 由 上 述 11 国 以 及 欧洲 研究 委员 会 拨 
款 支持 的 科研 项 目 , 都 必须 将 研究 成 果 发 表 在 完全 开 
放 获 取 期 刊 或 出 版 平台 上 。”S 计划 作为 0A2020 的 行 
动 计划 ,带动 全 球 加 快 开放 出 版 步伐 ,改变 传统 学 术 出 
版 格局 o 2018 年 11 月 , 惠 康 基金 会 和 比尔 及 梅 琳 
达 : 盖 茨 基金 会 加 入 S$ 计划 。 惠 康 基金 会 和 比尔 及 梅 
琳 达 ' 盖 蒋 基金 会 更 新 了 开放 获取 政策 :2020 年 1 月 
起 ,资助 项 目 成 果 论 文 全 部 需要 开放 获取 ,可 以 从 PMC 
和 EuropePMC 检索 ,并 将 不 再 承担 受 资 助 者 在 混合 开 
放 获 取 ( 同 时 拥有 订阅 和 免费 内 容 ) 期 刊 上 发 表 文 章 
的 费用 。2018 Æ 12 月 2 -4 日 ,在 德国 召开 了 第 14 


— 


网 络 ,创建 更 加 可 持续 创新 的 系统 ,共享 研究 成 果 , 可 
以 提供 全 球 研究 的 全 面 视野 ,同时 也 使 得 每 个 学 者 和 


届 开 放 获 取 柏 林 会 议 ,37 个 国家 的 资助 机 构 、 科 研 与 
教育 机 构 和 图 书馆 参加 ,进一步 协调 推进 立即 全 面 开 
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放 获取 的 政策 。 与 会 代表 一 致 同意 :努力 保证 作者 保 
留 论 文 著作 权 ,努力 实现 论文 的 全 面 立 即 开 放 获 取 , 努 
力 建 立 短 期 的 过 渡 性 的 转型 协议 将 订购 期 刊 转换 为 开 
放出 版 ,而 且 这 些 协 议 至 少 应 不 增加 成 本 并 在 以 后 随 
着 市 场 转 换 而 调整 ,会 议 代 表 期 待 出 版 社 与 国际 科研 
界 一 起 共同 努力 实现 论文 的 全 面 立 即 开放 获取 。 中 国 
国家 自然 科学 基金 委 、 国 家 科技 图 书 文献 中 心 .中科院 
文献 情报 中 心 代表 在 会 议 上 发 布 立 场 声 明 , 明确 表示 
中 国 支持 0A2020 me S 计划 ,支持 公共 资助 
项 目 研 究 论文 立即 开放 获取 经 

S 计划 在 实施 建议 中 ,要 求 IR 必须 在 OpenDOAR 
中 注册 或 正 申 请 注册 。 此 外 ,还 需要 遵循 以 下 标准 :JD 
提供 自动 存 缴 功能 ;@ 按 照 JATS 等 标准 以 XML 格式 
保存 全 文 ;@ 以 标准 互 操作 格式 提供 高 质量 的 元 数据 ， 
包租 关于 出 版 物 DOI, 缴 存 版 本 (AAM 或 COR) .开放 
ABBA ds . 缴 存 版 本 许可 等 内 容 ;@ 符 合 cOAlition S 元 
交 担 标准 规范 ;@ 提 供 开放 APT, 允许 其 他 人 (包括 搜 
索 缠 掌 等 机 器 ) 对 内 容 进 行 访问 ;@ 提 供 质 量 保障 机 制 
来 将 内 容 全 文 与 核心 的 文摘 索引 服务 系统 关联 起 来 
( fin PubMed) ;QD 保证 长 期 可 靠 运行 ;@ 提 供 帮 助 咨 
ipte PM 
计划 已 经 影响 机 构 知识 库 的 发 展 方向 。COAR 
MIDE S 计划 ,将 会 在 下 一 代 机 构 知 识 库 技术 规范 中 , 支 
持 全 计划。 但 同时 对 S 计划 部 分 技术 标准 提出 意见 和 
AREN, 如 :@ 自 动 存 缴 解决 方案 尚 不 成 熟 ,不 应 强 
BB XML. 格式 过 于 耗费 资源 ,应 要 求 符合 获取 
全 亦 的 标准 规范 ， 如 符合 Signposting 协议 , 而 非 强制 要 
REH XML f&5X.,. OF Ù API 要 求 过 于 模糊 ,不便 
于 操作 ,应 提供 部 分 推荐 API 建议 。@ 应 增加 允许 
OpenAIRE 收割 数据 要 求 。( 欧洲 开放 获取 基础 设施 研 
究 项 目 ,Open Access Infrastructure Research for Europe, 
简称 OpenAIRE) 。@ 帮 助 咨询 服务 是 大 多 数 机 构 网 站 
提供 的 服务 ,不 必 做 为 IR 的 强制 要 求 ”。 正 在 开发 
并 计划 在 2019 年 发 布 的 DSPACE7.0 版 本 ,已 经 在 根 
据 S 计 划 , 增 强 自 动 存 缴 、 支 持 XML-JATS、 更 多 样 的 
API 服务 等 功能 。 


3 ”新 一 代 机 构 知 识 

新 一 代 机 构 知 识 库 突破 “数字 化 采集 和 完整 保存 
单一 或 多 个 大 学 的 知识 成 果 产 出 的 交流 平台 ”” 的 机 
构 知 识 库 定义 ,将 机 构 知识 库 定义 提升 为 :分 布 式 全 球 
网 络 化 新 型 学 术 交 流体 系 的 基础 ,以 研究 为 中 心 .提供 
面向 研究 所 需 的 开放 增值 服务 ,提供 多 种 研究 成 果 的 


库 技术 和 功能 特点 
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开放 获取 ,支持 学 术 成 果 广 泛 传播 ,推动 建立 新 型 学 术 
出 版 和 研究 评估 的 平台 。 

重新 思考 开放 获取 ,突破 现 有 机 构 知识 库存 档 、 管 
理 发布、 检索 和 开放 共享 的 目标 定位 ,打破 单一 机 构 
限制 和 学 者 服务 范围 ,从 全 球 学 术 交 流 和 创新 研究 视 
野 出 发 ,面向 未 来 ,新 一 代 机 构 知 识 库 的 建设 目标 是 成 
为 全 球 新 型 学 术 交 流 生态 系统 的 重要 基础 设施 ,能 够 
管理 多 种 类 型 的 学 术 资 源 ,包括 :论文 .图 书 、 报 告 . 数 
据 、 软 件 . 工 具 等 ,成 为 全 世界 学 者 学 术 交 流 提供 服务 
的 学 术 资 源 中 心 。 新 一 代 机 构 知 识 库 是 能 够 实现 数据 
互 操作 的 网 络 知识 库 , 是 用 户 友好 、 机 器 友好 的 知识 
E ,是 为 每 个 学 者 和 机 构 提 供 设施 .数据 和 服务 的 全 球 
学 术 交 流 基础 。 在 新 一 代 机 构 知 识 库 上 ,能 够 实现 多 
种 增值 服务 ,包括 学 术 评 价 \ 同 行 评审 和 学 术 社 交 等 ， 
以 学 术 交 流 为 中 心 ,全面 支持 学 术 开 放 和 人 研究 创新 。 
3.1 新 一 代 机 构 知 识 库 的 功能 、 技 术 、 标 准 和 协议 

COAR 提出 新 一 代 机 构 知 识 库 应 具有 的 11 种 技 
AR ,标准 和 协议 。 图 1 是 新 一 代 IR 与 现 有 IR 的 架构 
对 比 图 ,在 新 一 代 机 构 知识 库 中 ,通过 集成 云 计算 、 
搜索 和 内 容 管 理 等 全 新 技术 ,设计 全 新 IR 云 基础 设 
施 ,提供 更 多 服务 协议 ,标准 和 服务 ,为 IR 开发 更 多 增 
值 服 务 提 供 支持 。 


现 有 IR 新 一 代 IR 


基于 当前 IR 的 增值 服务 ~$ 


n 


[oes 基于 新 一 代 IR 的 增值 服务 


、 ，| | 学 术 评价 | 同行 评审 || 消息 
全 球 统一 认证 
内 容 “| 资源 关联 || 通知 


互 操作 性 
数据 保存 层 


元 数据 
互 操作 性 


数据 保存 层 


1 新 一 代 IR 与 现 有 IR 的 架构 对 比 


(1) 公 开标 识 符 (Exposing Identifiers) 。 访 问 IR 
等 学 术 门 户 网 站 时 ,用 户 可 以 轻松 找 出 目标 网 页 .书目 
记录 链接 \ 作 者 身份 等 。 但 是 ,由 于 门户 网 站 使 用 不 同 
的 方法 展示 内 容 , 对 搜索 引擎 等 收割 数据 服务 却 很 难 
解决 。 如 何 能 够 方便 用 户 定位 与 引用 IR 资源 ,如 何 能 
够 让 数据 交互 更 为 顺畅 ,让 搜索 引擎 能 够 准确 获取 数 
据 ,IR 中 的 数据 (元 数据 和 成 果 ) 具有 唯一 标识 是 可 行 
的 解决 方案 。 

Signposting 是 一 种 使 学 术 网 络 对 机 器 更 友好 的 方 
法 。 它 使 用 Typed Links 方法 来 区 分 学 术 门 户 中 重复 
出 现 模式 。 对 于 任何 媒体 类 型 的 资源 ,类 型 链接 都 会 
fr HTTP 链接 头 中 提供 。 对 于 HTML 资源 ,它们 还 在 
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ER, WR, F MFE. 新 一 代 机 构 知 识 库 的 关键 技术 和 发 展 趋势 研究 [J]. 图 书 情报 工作 ,2019 ,63(19):96 - 104. 


HTML 链接 元 素 中 提供 。Signposting 使 用 类 型 链接 (在 
HTTP 链接 头 , HTML < link > 元 素 或 < rs:ln > Re- 
sourceSync 元 素 中 ) 来 判断 学 术 门 户 重 复 内 容 出 现 模 
式 。Signposting 可 用 于 文 持 自动 发 现 与 学 术 对 象 有 关 
的 各 种 资源 ,包括 书目 描述 .持久 标识 符 .许可 信息 、 作 
者 或 作为 对 象 一 部 分 的 各 种 资源 。 在 网 站 上 采用 
Signposting 方法 ,能够 允许 机 器 以 统一 的 方式 定位 学 
术 门 户 内 容 , 有 助 于 数据 互 操作 。HTTP 链接 头 方式 有 
很 多 好 处 , 标 头 方法 可 用 于 任何 媒体 类 型 的 资源 ,而 不 
仅仅 是 HTML。 因 此 ,图 像 、 数 据 集 、PDF 等 都 可 以 统 


日 于 创建 和 管理 它们 的 相关 协议 。 注 释 使 用 基于 RDF 
的 词汇 表 来 表达 ,并 且 可 以 呈现 为 JSON -LD。 该 协议 
基于 HTTP 并 遵循 REST 设计 原则 '”。 国际 图 像 互 操 
作 性 框架 
Framework , MIF ) 是 一 个 支持 图 像 互 操作 API 的 协议 ， 

用 于 图 像 复 用 ,共享 和 与 交互 。 应 用 IIF 协议 ,可 以 对 
图 像 实现 操作 评论 引用、 分享 和 认证 访问 等 功 
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(5) 资 源 转移 (Resource Transfer), 2j fg 3X, , Ie] 2&8 
化 、 云 存储 模式 ,是 新 一 代 机 构 知 识 库 的 核心 架构 , 需 


一 使 用 相同 的 方法 来 阐明 模式 。 可 以 使 用 仅 返 回 事务 
元 数据 而 非 内 容 的 HTTP. HEAD 请求 来 访问 标 头 ,可 以 
获得 大 量 资源 的 头 部 ,例如 大 数据 集 或 高 分 辩 率 图 像 ， 


而 元 需 实 际 下 载 这 些 资源 。 以 类 似 的 方式 , HTTP 
HEAD 请 求 可 用 于 获取 受 限 内 容 的 标 头 ,包括 付费 应 


(2 ) 在 资源 级 别 声 明 许可 协议 (Declaring Licenses 
如 何 让 用 户 与 机 器 都 能 清楚 IR 
资源 的 知识 产权 许 可 情况 ? 在 内 容 组 织 中 ,增加 明确 
的 鸡 可 标识 ,在 HTTP 链接 增加 许可 信息 ,是 有 效 的 解 
UJ. W Signposting 方法 ,在 HTTP 链接 增加 知识 
PEX, 如 Creative Commons Copyright Licenses 相关 
"A, 是 解决 方案 
>(3) 22 Discovery through Navigation) 。 
TRE: 的 成 果 数 据 类 型 丰富 ,一 条 元 数据 可 能 会 对 应 
PE 和 /或 HTML 版 本 的 论文 .一 个 或 多 个 支持 数据 
集 3 图 书 或 表格 附件 等 。 为 了 帮助 机 器 准确 识别 数据 
对 各, 实现 准确 的 搜索 和 导航 ,在 ^: HTTP 链接 中 提供 数 
据 链接 关系 、 数 据 类 型 等 是 有 效 的 解决 方法 。 通 过 
Signposting 方法 ,在 HTTP 链接 中 增加 一 组 Web 资源 
信息 是 一 种 解决 方案 

(4) 与 资源 交互 (注释 ， 评论 和 评述 
with Resources ( Annotation, Commentary and Review) ) 
大 量 研 究 已 经 证 明 ,提供 用 户 交 互 功能 ,能 够 增加 用 户 
参与 度 。 通 过 接 人 第 三 三 方 社交 媒体 服务 ， 允许 用 户 注 
释 、 评 论 和 评述 ,IR 可 以 发 挥 学 术 交 流 中 心 作用 ,促进 
研究 者 讨论 和 协作 工作 。 

Activity Streams 2.0 是 一 种 描述 与 资源 交互 的 方 
法 ,包括 评论 、 点 赞 、 共 享 等 。 交 互 表 示 为 JSON-LD 并 
使 用 Activity Streams 2. 0 词汇 表 。 虽 然 该 词汇 表 针 对 
的 是 一 般 社 交 网 络 活动 ,但 仍 可 以 扩展 学 术 词 汇 
XP Web Annotation Model and Web Annotation Pro- 
tocol 是 专门 表达 注释 (包括 评论 .评述 等 ) 的 方法 以 及 


esource Level ) 。 


) ( Interacting 


要 实现 资源 内 容 的 分 布 式 部 署 。 云 存储 和 云 计算 技术 
已 经 成 熟 , 能 够 支持 所 需 应 用 实现 。 

IPFS 是 点 对 点 超 媒 体 协 议 , 旨 在 使 网 络 更 快 、 更 安 
全 、 更 开放 。 应 用 IPFS 协议 ,可 以 实现 多 方 之 间 共 享 
大 数据 集合 的 需求 。ResourceSyne 是 一 种 基于 站 点 
地 图 的 规范 ,存储 库 管 理 器 可 以 使 用 该 规范 提供 信息 ， 
允许 第 三 方 系统 持续 与 其 存储 库 中 的 资源 保持 同步 ， 
即 创建 更 新 和 删除 。 站 点 地 图 允许 公开 知识 库 内 容 
和 搜索 引擎 所 需 的 元 数据 。ResourceSync 可 用 使 用 
Sitemaps XML 格式 实现 内 容 和 元 数据 的 发 现 和 同 
步 ” 。SWORD( 简 单 知识 库 内 容 Web 服务 提供 ) 是 一 
种 轻 量 级 协议 ,用 于 将 内 容 从 一 个 位 置 存储 到 男 一 个 
ME, 

(6) 批 量 发 现 ( Batch Discovery) 。 随 着 TR 的 发 展 ， 
用 户 需 要 统一 、 跨 平台 的 知识 库 资源 发 现 服务 ,需要 资 
源 文 本 内 容 的 搜索 。 实 现 全 球 知识 库 学 术 搜索 功能 ， 
是 新 一 代 机 构 知 识 库 的 重要 目标 。 使 用 ResourceSyne, 
Signposting , Sitemaps 等 协议 应 用 ,实现 批量 搜索 ,能 够 
提升 知识 库 资 源 价值 。Sitemaps 提供 了 易于 搜索 引擎 
抓 取 网 站 内 容 的 方法 。 在 最 简单 的 形式 中 ,Sitemap 是 
一 个 XML 文件 ,其 中 列 出 了 每 个 可 用 资源 的 URL 以 
及 有 关 该 资源 的 可 选 附 加 元 数据 ( 例如 修改 日 期 ,更改 
频率 等 ) A BIER RISE 准确 获取 数据 ”| 。 

(7) 收 集 和 公开 活动 (Collecting and Exposing Ac- 
机 构 知 识 库 需要 主动 并 实时 收集 和 公开 活 
动 (包括 任何 修改 、 增 加 、 评 论 \ 注 释 、 同 行 评议 .访问 、 
下 载 等 ) ,并 实时 发 送 通 知 给 相关 用 户 ,提供 用 户 所 需 
的 多 种 增值 服务 ,使 IR 成 为 学 术 交 流 社区 。 实 现 通 知 
机 制 ,除了 需要 资源 对 象 具有 唯一 标识 符 和 用 户 需 要 
身份 认证 外 ,还 需要 应 用 多 种 标准 协议 和 技术 。 

Activity Streams 2.0 为 资源 活动 信息 提供 语义 定 
义 规范 ,通过 JSON 格式 和 词 表 规范 ,提供 活动 结构 化 
描述 方法 。 关 联 数 据 通 知 (Linked Data Notifications ) 是 


tivities ) 。 
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图 二 情报 三 作 
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种 通用 通知 协议 ,描述 服务 器 (接收 方 ) 如 何 将 应 用 


身份 层 , 用 于 分 布 式 身份 验证 。OpenID Connect 允许 


程序 (发 件 人 ) 推 送 给 它们 的 消息 ,以 及 其 他 应 用 程序 
(消费 者 ) 如 何 检索 这 些 消 息 。 任 何 资 源 都 可 以 通知 
消息 的 接收 端点 ( 收 件 箱 )。 消 息 以 RDF 格式 定义 ,可 
以 包含 任何 数据 。 其 中 任何 资源 都 可 以 通知 收 件 箱 ， 
该 收 件 箱 可 以 发 布 与 该 资源 相关 的 通知 。 例 如 ,注释 、 
评论 或 审阅 信息 ,通知 该 资源 发 生 的 交互 ,交互 内 容 、 
交互 参与 者 等 。 通 知 表达 方式 为 JSON-LD 并 使 用 Ac- 
tivity Streams 2. 0 JIC Æ ^ , ResourceSyne Change No- 
tifications 是 基于 WebSub 的 发 布 / 订 阅 协议 ,并 向 订阅 
者 发 送 知 识 库 资源 相关 修改 (创建 /更 新 /删除 ) 的 通 
知 。ResourceSync 通知 可 用 于 内 容 和 元 数据 的 发 现 和 
同步 ,并 使 用 Sitemaps XML f& X", Webmention 是 一 
种 8 对 点 的 trackback/pingback 方法 , 则 在 通知 资源 链 


接 变 化 ,支持 双向 链接 “” 。WebSub 是 一 种 出 版 /订阅 
协 说 ,出 版 者 将 资源 更 新 通知 发 布 订阅 用 户 。 机 构 知 
大 通 过 WebSub 与 出 版 社 实现 资源 交互 ,及 时 获取 
诊 允 引用、 评论 .评述 等 数据 ”  。 其 他 消息 传递 协议 
(例如 AMQP ,Kafka) 为 所 有 Web 内 容 发 布 者 和 订阅 者 
司 提 供 了 通用 通信 机 制 。 

(8) Hj P iR yi] ( Identification of Users) 。 资 源 交 互 


FUR lh AI EA MEDEMA ,都 需要 用 户 具 有 
WECUR HIR, d CEU VEUS 5 FP REOR RR. 4 


(yh 识 可 以 使 用 ORCID, Social. Network Identities , 
WeBID 4€, ORCID ( Open Researcher and Contributor T- 
depitifier ,开放 研究 者 与 贡献 者 身份 标识 符 ) 提供 一 个 
永 矢 性 的 数字 标识 符 给 研究 者 ,并 通过 与 主要 研究 工 
信 源 程 (例如 手稿 和 出 版 成 果 ) 集 成 ,实现 研究 者 与 学 
术 活 动 的 自动 链接 ,识别 研究 者 学 术 成 果 “” 。 社 交 媒 
体 身 份 标识 ( Social Network Identities) 由 多 个 社交 网 
络 平台 提供 。WebID 是 一 个 代理 HTTP ( S) URI, 通 常 
由 代理 (个 人 组织 ,设备 等 ) 在 所 属 域 中 创建 。WebID 
基于 RDF 的 配置 文件 机 器 可 读 ,通常 与 WebID/TLS 身 
份 认证 和 Web 访问 控制 认证 方法 结合 使 用 ”。 

(9) 用 户 认 证 (Authentication of Users) 。 提 供用 户 
交互 与 个 性 化 增值 服务 ,需要 用 户 身 份 识别 和 认证 功 
能 ,包括 学 术 身 份 (如 ORCID ) 和 社交 网 络 (如 Twitter、 
Google , Facebook , [8 , Mastadon ) 身份 。 

HTTP 签名 提供 了 类 似 于 WebID/TLS 的 身份 验证 
方法 。Sign HTTP messages 除了 里 份 验证 之 外 , 它 还 允 
许 验证 客户 端 和 服务 器 之 间 的 通信 未 被 算 改 。 该 方法 
目前 正在 IETF 申请 标准 , 值得 进一步 关注 ”。 
OpenID Connect 1. 0 是 在 OAuth 2.0 协议 之 上 的 简单 
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客户 端 应 用 程序 (例如 机 构 知 识 库 和 浏览 器 ) 通 过 用 
户 身份 提供 者 进行 身份 验证 。 认 证 成 功 后 可 以 将 关于 
有 户 的 基本 信息 返回 给 客户 端 应 用 程序 。 该 协议 支持 
可 扩展 ,允许 开发 应 用 者 使 用 可 选 功能 ,如 :身份 数据 
加 密 .OpenID 服务 方 信息 和 Session 会 话 管理 。 主 要 社 
交 媒 体 已 经 支持 OpenID Connect, ORCID 目前 在 测试 
阶段 ”。WebID / TLS 是 基于 传输 安全 层 协 议 
(TSL),X.509 证 书 和 WebID 等 实现 安全 用 户 身份 验 
证 的 协议 。 它 使 用 户 只 需 从 浏览 器 给 出 的 证 书 中 选择 
所 需 证 书 即 可 进行 身份 验证 ,用 于 解决 服务 器 获取 用 
户 私 钥 信 息 和 用 户 WebID。 通 过 WebID ,获取 包含 用 
户 私 钥 的 个 人 信息 并 进行 验证 。WebID / TLS 虽然 是 
完全 分 布 式 的 高 效 方法 ,但 由 于 难以 生成 证 书 和 用 户 
界面 ,一 直 没 有 得 到 广泛 应 用 。 

(10) 公 开标 准 化 使 用 计量 指标 ( Exposing Stand- 
ardized Usage Metrics)。 通 过 共享 用 户 交 互 数据 ,机 构 
知识 库 可 以 开发 和 提供 更 多 用 户 需 要 的 增值 服务 。 收 
集 .管理 和 提供 标准 使 用 计量 指标 数据 ,是 能 够 让 作者 
和 所 有 用 户 了 解 机 构 知 识 库 价值 所 在 的 重要 服务 。 为 
保证 数据 准确 可 靠 、 可 信 , 需 要 采用 通用 标准 协议 、 方 
法 和 互 操作 ,让 用 户 看 到 完整 的 计量 数据 。 如 果 能 够 
基于 数据 ,建立 全 球 机 构 知 识 库 标 计量 指标 体系 ,提供 
与 商业 期 刊 无 关 的 评价 系统 ,意义 将 更 为 深远 。 通 过 
定量 数据 和 用 户 交 互 (注释 .评论 .评述 ) 的 定性 数据 
结合 应 用 ,机 构 知 识 库 有 可 能 完成 这 样 的 目标 。 定 量 
数据 可 以 通过 两 种 模式 实现 :获取 模式 (如 使 用 SU- 
SHI) 或 推送 模式 (如 :google -analytics, IRUS - UK, 
OpenAIRE 使 用 的 Piwik, RAMP) 。 公 开 使 用 指标 需要 
解决 公开 障碍 ,需要 通过 通用 标准 推动 ,而 不 仅仅 是 技 
术 。COUNTER 标准 使 用 户 能 够 获取 电子 资源 的 使 用 
统计 。 该 标准 被 称 为 “行为 准则 ” ,确保 供应 商 和 出 版 
商 能 够 为 用 户 提供 一 致 .可 靠 和 可 比较 的 使 用 数 
i" , SUSHI 是 ANSI / NISO 标准 , 它 定义 了 用 于 收 
割 电子 资源 使 用 数据 的 自动 请 求 和 响应 模型 , 与 
COUNTER 一 起 使 用 。ETag 或 entity tag 是 HTTP 的 一 
部 分 , 它 是 HTTP 为 Web 缓存 验证 提供 的 几 种 机 制 之 
一 , 它 人 允许 客户 端 进行 条 件 请 求 。 这 允许 缓存 更 高 效 
并 节省 带宽 ,因为 如 果 内 容 未 更 改 , 则 Web 服务 器 不 
需要 发 送 完整 响应 。ETag 还 可 用 于 并 发 控制 ,作为 一 
种 防止 资源 同时 更 新 导致 互相 覆盖 的 方法 ,有 助 于 文 
持 系 统 仅 获取 有 关 指 标的 新 数据 。 

(11) 资源 长 期 保存 (Preserving Resources) 。 开 放 
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获取 的 意义 不 仅 在 于 开放 访问 现在 的 学 术 资 源 , 还 在 
于 永久 访问 和 长 期 保存 。 长 期 保存 不 需要 每 个 知识 库 
独立 进行 ,而 是 应 该 通过 标准 \ 协 议和 互 操作 ,建立 机 
构 和 全 球 学 术 资 源 的 长 期 保存 网 络 。 保 存 , 需 要 保持 


在 数据 建设 基础 上 ,建设 科研 管理 系统 成 果子 系统 ,成 
为 机 构 学 术 成 果 仓 储 。 未 来 将 进一步 改进 和 增强 功能 
服务 ,实现 机 构 学 术 成 果 信 息 基 础 设施 的 建设 目标 。 

3.2.2 从 自 存 档 到 自动 提交 新 一 代 机 构 知 识 库 , 通 


资源 (资源 .元 数据 和 结构 信息 ) 的 复杂 互 连 ,还 需要 
通过 新 技术 实现 实时 获取 和 保存 数据 ,数据 格式 应 尝 
试 应 用 可 重复 使 用 的 格式 (如 Latex RI TEL, 而 不 是 
PDF) 。 长 期 保存 是 一 项 极其 复杂 的 活动 ,涉及 政策 、 
标准 .实践 和 技术 等 ,需要 重视 .研究 和 应 用 。 

3.2 ”新 一 代 机 构 知 识 库 的 发 展 趋势 

3.2.1 从 机 构 学 术 仓储 到 机 构 信息 基础 设施 ”新 一 
代 机 构 知 识 库 的 建设 目标 ,是 成 为 全 球 新 型 学 术 交 流 
生态 系统 的 重要 基础 设施 ,能 够 管理 多 种 类 型 的 学 术 
资源 管理 ,包括 :论文 图书, 报告 ,数据 软件 、 工 具 等 ， 
成 沪 全 世界 学 者 学 术 交流 提供 服务 的 学 术 资 源 中 心 。 
上 机 构 知识 库 是 能 够 实现 数据 互 操作 的 网 络 知识 
诽 , 是 用 户 友好 、 机 器 友好 的 知识 库 , 是 为 每 个 学 者 和 
机 得 提 供 设施 数据 和 服务 的 全 球 学 术 交 流 基础 。 其 
旋 证 ,以 完整 学 术 资 源 数据 汇集 为 基础 ,建设 学 术 资 源 
管理 与 服务 平台 ,实现 学 术 资 源 管理 与 服务 功能 。 从 
而 好 以 实现 :改善 全 球 学 术 交 流 信息 基础 设施 与 环境 ， 
促 囊 交叉 学 科 交 流 与 合作 ;为 全 世界 的 研究 者 提供 完 
办. 壮 富 、 多 样 、 创 新 的 学 术 信息 ;为 研究 者 提供 开放 学 
术 信 息 环境 ,成 为 国际 一 流 学 术 交流 的 一 部 分 ;参与 到 
念 肖 学 术 交 流 重 构 进程 中 ,成 为 新 型 学 术 交流 规则 的 
制定 者 。 

-三 新 一 代 机 构 知 识 库 具 有 以 下 功能 特点 :基于 开 
放 柱 架设 计 的 云 平台 架构 ,提供 多 种 开放 服务 接口 ,能 
够 与 全 球 学 术 交 流 信息 基础 设施 实现 数据 互 操作 和 合 
作 服 务 。@@ 支 持 多 种 类 型 资源 的 管理 和 服务 ,包括 学 
术 成 果 、 档 案 资料 ,研究 数据 软件 工具 等 。@ 遵 循 公 
开标 识 符 标准 规范 ,所 有 数据 都 能 够 基于 标识 符 与 全 
球 机 构 知 识 库 实现 互 操作 。 团 提供 学 术 资 源 长 期 保 
16 .管理 与 服务 ,遵循 OAIS 框架 ,支持 公开 标识 符 , 提 
供 数据 格式 进行 识别 和 迁移 转换 服务 。@ 提 供 统一 、 
完整 的 学 术 搜索 服务 。 通 过 开放 服务 框架 和 接口 ,新 
一 代 机 构 库 要 么 可 以 提供 全 新 的 比 现 有 学 术 发 现 更 优 


过 互 操作 技术 与 出 版 商 合 作 等 方法 ,从 自 存 档 方式 转 
为 自动 提交 工作 流程 ,提供 自 存 档 、 自 动 收割 数据 、 代 
理 提 交 、 跨 系统 合作 等 多 种 存 缴 方 式 。 实 现 多 种 提交 
功能 :中 通过 互 操作 ,与 数据 库 商 合作 ,实现 数据 自动 
提交 。 或 与 出 版 商谈 判 ,由 出 版 商 直 接 提供 内 容 。@ 
提供 数据 工具 和 接口 ,能 人 到 用 户 工 作 流 程 中 ,减少 自 
存档 操作 步 又。 如 基于 数据 互 操作 协 SWORD ,实现 从 
Word 直接 提交 。 数 据 工具 可 以 自动 抽取 元 数据 或 者 自 
动 生 成 元 数据 ,改进 元 数据 质量 。(3 全 球 机 构 知 识 库 之 
间 数 据 交 互 。 以 美国 自然 科学 基金 委员 会 (National Sci- 
ence Foundation, NSF) 的 机 构 知 识 库 (NSF Public Access 
Repository, NSF-PAR) 为 例 ,NSF -PAR 与 能 源 部 (the De- 
partment of Energy, DOE) 和 科学 和 技术 信息 办 公 室 ( Of- 
fice of Science and Technical Information, OSTI) 的 机 构 知 
识 库 建立 互 操作 性 。2018 年 春季 开始 ,两 个 机 构 (NSF 
和 DOE) 资 助 的 出 版 物 的 作者 可 以 一 次 性 存放 其 原稿 的 
最 终 版 本 ,在 DOE/OSTI 系统 中 成 功 存放 符合 条 件 的 出 
版 物 的 作者 现在 可 以 通过 NSF-PAR 无 颖 地 发 布 他 们 的 
出 版 物 Pubmed 与 NSF 交换 数据 ”。 
3.2.8. 从 独立 平台 到 与 科研 管理 系统 融合 与 发 展 
实践 证 明 ,与 科研 管理 系统 融合 ,机 构 知 识 库 更 具有 可 
持续 ,能 够 更 好 地 支持 机 构 学 术 和 科研 管理 活动 ,实现 
新 一 代 机 构 知 识 库 成 为 信息 基础 设施 的 目标 。 与 科研 
管理 系统 融合 ,机 构 知 识 库 提供 学 术 资 源 数据 的 收集 、 
保存 .管理 和 服务 ,为 研究 者 提供 自动 提交 服务 ,为 科 
研 管 理 提 供 服 务 。 而 科研 管理 流程 和 研究 者 确认 学 术 
成 果 数 据 过 程 ,支持 机 构 知 识 库 完成 数据 确认 流程 ,得 
到 完整 ,准确 的 成 果 数 据 , 并 建立 成 果 和 学 者 的 关联 关 
系 ,建设 高 质量 学 术 资 源 仓储 ,为 提供 更 多 增值 服务 、 
实现 成 为 学 术 交 流 社区 和 建立 全 新 学 术 评 价 体系 学 术 
评价 英 定 了 基础 。 

融合 方式 可 以 有 多 种 形式 ,如 :中 基于 机 构 知 识 库 
的 融合 。 即 在 机 构 知 识 库 的 基础 上 进行 扩展 ,增加 科 


的 发 现 服务 ,要么 与 更 优 的 学 术 发 现 合作 ,为 用 户 提供 
统一 .路 平 台 的 知识 库 资源 发 现 服务 ,实现 全 球 知识 库 
学 术 搜索 功能 。 

以 北京 大 学 机 构 知 识 库 为 例 ,截至 2018 年 12 月 ,该 
机 构 知 识 库 收集 了 北京 大 学 自 1949 年 以 来 54 万 元 数据 
fll 30 万 全 文 数据 ,逐步 建立 完整 的 机 构 学 术 论文 数据 。 


研 管 理 的 功能 。 目 前 ,香港 大 学 采用 了 这 种 实现 方式 ， 
通过 在 DSpace 的 基础 上 增加 CRIS 模块 ,实现 了 CER- 
IF 兼容 的 DSpace-CRIS 系统 。@ 基 于 科研 管理 系统 的 
融合 。 即 在 科研 管理 系统 的 基础 上 ,增加 具有 开放 获 
取 功 能 的 机 构 知 识 库 模 块 。 目 前 ,伦敦 国王 学 院 
(King's College London ) .加拿大 皇后 大 学 (Queen ”s 
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University ) 采 用 了 这 种 方式 ,通过 在 Pure 的 基础 上 增 
加 开放 功能 的 前 端 界面 ,用 户 可 以 下 载 获 取 科研 成 果 
数据 。@ 基 于 系统 间 互 操作 的 融合 。 即 机 构 知 识 库 与 
科研 管理 系统 独立 运行 ,并 通过 API 的 方式 实现 系统 
间 互 操作 。 目 前 , 圣 安 德 鲁 斯 大 学 便 采用 了 这 种 方式 ， 
通过 使 用 Pure 来 收集 整理 相关 成 果 数 据 ,并 将 能 够 开 
放 获取 的 数据 推送 到 机 构 知 识 库 中 ,从 而 源源 不 断 的 
为 机 构 知 识 库 注 入 新 鲜 成 果 。 

北京 大 学 科研 管理 系统 成 果子 系统 ,由 图 书馆 负 
责 在 IR 基础 上 ,扩展 功能 ,实现 科研 管理 和 机 构 知 识 
库 的 统一 管理 和 服务 。 成 果子 系统 包括 7 个 模块 (如 
图 2 所 示 ) :登录 认证 .权限 管理 .成 果 提 交 、 成 果 认 领 、 
成 果 评奖 数据 统计 .API 接口 。 原 有 的 DSpace 系统 并 
不 能 满足 现 有 需求 ,因此 在 DSpace 的 基础 上 进行 了 大 
量 关 次 开发 工作 。 所 有 这 些 功能 模块 都 在 机 构 知识 库 
展 实 现 ,同时 为 了 更 好 的 满足 用 户 使 用 习惯 ,成 果 认 
INRE 、 数 据 统计 等 模块 也 在 科研 管理 系统 中 实 
现 忆 北京 大 学 科研 管理 成 果子 系统 的 开发 应 用 ,一 广 
而 甬 展 了 机 构 知识 库 的 功能 ,将 其 纳入 到 科研 管理 过 
程 遇 , 另 一 方面 ,通过 系统 间 互 操作 ,最 终 实现 了 北京 
)E 罗 机 构 知识 库 与 科研 管理 系统 的 融合 ,为 机 构 知识 


注 人 了 更 强 的 生命 力 。 

CN MEE 
mu 北京 大 学 科研 管 
> 理 成 果子 系统 


认证 管理 提交 认领 评奖 | | 统计 接口 


图 2 北京 大 学 科研 管理 成 果子 系统 模块 


3.2.4 从 学 术 成 果 管 理 平 台 到 学 术 资 源 服务 中 心 

大 数据 与 人 工 智能 快速 发 展 ,数据 和 软件 工具 日 益 重 
要 ,研究 数据 作为 科学 研究 的 重要 成 果 受 到 国际 学 术 
界 和 出 版 领域 越 来 越 多 的 重视 。 支 持 管理 多 种 类 型 的 
学 术 资 源 ( 包 括 数据 和 软件 工具 ) ,支持 研究 数据 服 
务 ,转型 成 为 学 术 资 源 服 务 中 心 ,成 为 新 一 代 IR 的 重 
要 功能 之 一 。 目 前 ,已 经 有 多 个 机 构 知 识 库 提供 多 种 
方式 的 数据 服务 ,有 建设 数据 服务 平台 ,收集 研究 数据 
并 提供 服务 ,北京 大 学 、 复 旦 大 学 、 哈 佛 大 学 等 多 个 机 
构 都 是 采用 此 种 方式 , 北京 大 学 还 将 IR 成 果 与 成 果 
所 用 数据 通过 持久 标识 符 ( Handle DOI) 建立 关联 。 也 
有 在 IR 平 台 上 直接 扩展 收集 研究 数据 并 发 布 服务 。 
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D. J. Lee 通过 对 美国 13 所 大 型 研究 型 大 学 的 15 名 
IR 管理 人 员 关 于 研究 数据 管理 服务 的 访谈 ,研究 IR 
建设 中 能 够 提供 哪些 研究 数据 服务 “” 。 布 里 斯 托 大 
学 在 IR 平台 上 ,延伸 研究 数据 服务 。 新 一 代 机 构 
知识 库 , 需 要 在 信息 架构 上 ,支持 海量 数据 的 管理 和 服 
务 ,提供 研究 数据 服务 ,为 用 户 提供 完整 研究 生命 周期 
的 数据 服务 。 
3.2.5 从 海量 学 术 成 果 数 据 检 索 到 大 数据 语义 研究 
支持 ”大 数据 和 人 工 智 能 技术 的 快速 发 展 ,语义 搜索 
技术 结合 机 器 学 习 ,提供 了 更 全 面 和 准确 的 搜索 结果 。 
商业 数据 库 已 经 开始 应 用 与 发 布 相应 服务 。 以 IEEE 
(ieee. org) 与 ip. com 合作 发 布 的 专利 数据 库 Innova- 
tionQ Plus( innovationqplus. ieee. org) 为 例 , 该 数据 库 使 
日 语义 搜索 来 实现 通过 概念 而 不 是 关键 字 进 行 搜索 。 
通过 构建 语义 关系 ,以 等 同 执行 搜索 查询 时 返回 的 蔡 
代 单 词 和 短语 。 通 过 使 用 机 器 学 习 来 提高 其 概念 搜索 
的 准确 性 。AI 公司 Luminance ( luminance. com ) 和 
iManage( imanage. com ) 使 用 机 器 学 习 和 模式 识别 技 
术 ,扫描 海量 法 律 文件 ,分 析 数 据 , 协 助 律师 分 析 法 律 
合同 。 新 一 代 机 构 知识 库 ,需要 研究 和 应 用 人 工 智 
能 和 机 器 学 习 技术 ,构建 语义 搜索 ,提供 数据 挖 气 和 文 
本 挖掘 功能 ,为 用 户 提供 研究 服务 。 
3.2.6 从 成 果 存 档 到 新 型 学 术 交流 社区 学 术 交 流 
新 生态 环境 下 ,在 线 社 区 交流 成 为 重要 的 学 术 交 流 场 
景 。 新 一 代 机 构 知 识 库 将 与 用 户 互动 (注释 、 评 论 、 评 
述 、 订 阅 \ 主 动 推送 等 ) 服 务 作为 增值 服务 设 重点 , 力 
通过 增值 服务 ,使 机 构 知 识 库 成 为 用 户 学 术 交 流 社区 。 
Facebook „Twitter 、 微 博 和 微 信 等 社交 媒体 已 经 使 人 们 
习惯 在 社交 媒体 和 社区 中 获取 和 交流 信息 。 新 一 代 机 
构 知 识 库 在 云 服 务 架构 和 完整 学 术 资 源 中 心 基础 上 ， 
提供 学 术 交 流 所 需 的 增值 服务 ,将 IR 建设 成 为 人 们 交 
流 学 术 信息 的 新 型 学 术 交 流 社区 。 

技术 教育 与 学 术 交 流 环 境 变革 ,使 IR 的 角色 与 
价值 发 生变 化 ,在 学 术 交 流 生命 周期 变革 中 找到 新 的 
角色 定位 ,并 发 挥 作用 ,成 为 新 一 代 IR 建设 的 目标 。 
3.2.7 从 应 用 计量 指标 到 建立 全 新 学 术 评 价 体 系 
量 实践 和 数据 已 经 证 明 ,提供 访问 统计 和 引用 频次 
等 计量 指标 ,能 有 效 提高 机 构 知识 库 成 果 的 学 术 影响 
力 和 可 见 度 ,众多 机 构 知 识 库 已 经 提供 了 多 种 统计 。 新 
一 代 机 构 知 识 库 , 需 要 提供 更 丰富 实时、 准确 的 计量 指 
标 数 据 。 通 过 对 数据 从 总 体 BLA .研究 者 .时 间 等 多 角 
度 进 行 统计 ,生成 各 层次 知识 目录 。 通 过 对 学 术 资 源 从 
多 维度 或 多 层面 进行 逻辑 语义 关系 分 析 和 关联 ,建立 知 
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ER, WR, F MFR. 新 一 代 机 构 知 识 库 的 关键 技术 和 发 展 趋 势 研究 [J]. 图 书 情报 工作 ,2019 ,63(19):96 - 104. 


识 图 谱 ,对 机 构 的 知识 能 力 、 知 识 关 系 、 知 识 资 产 应 用 和 
需求 等 进行 分 析 和 评估 。 通 过 对 用 户 使 用 情况 进行 分 
析 , 建 立 用 户 画 像 。 在 计量 \ 统 计数 据 、 知 识 图 谱 、 用 户 
画像 基础 上 ,建立 独立 于 现 有 商业 出 版 学 术 评 价 数 据 的 
全 新 学 术 评价 体系 , 重 构 学 术 评价 生态 系统 。 


学 术 交 流 快速 变革 进程 中 ,机 构 知识 库 需要 重 构 
功能 和 服务 ,成 为 新 一 代 学 术 交流 生态 系统 的 重要 基 
础 设施 。 研 究 新 一 代 机 构 知识 库 的 目标 .功能 、 服 务 和 
技术 ,探索 新 应 用 ,成 为 当前 机 构 知识 库 建设 的 重要 内 
容 。 中 国 机 构 知 识 库 建 设 ,需要 抓 住 这 一 发 展 转型 机 
遇 , 参 与 到 全 球 学 术 交 流 生态 系统 构建 中 ,成 为 重要 的 
组 成 部 分 ,引领 世界 科研 进步 。 
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Abstract. [Purpose/significance | By investigating the research status and service demand of the new generation 
knowledge at home and abroad, this paper analyzes the key technologies and functional characteristics of the next genera- 
tion repositories. It puts forward the key trends of institutional repositories, and provides some suggestions for the develop- 
ment of next generation repositories. [ Method/ process | Through literature research , this paper summarized the develop- 
ment trend of institutional repository technology and function. Then, it introduced 11 key technologies, standards and pro- 
tocols of the new generation repositories. By researching and designing the functions, it analyzed the development of next 
generation repositories in many aspects such as framework , functions and service target. [ Result/conclusion | The paper 
generalizes the development trends of next generation repositories as followings: (Dfrom institutional repository to institutional 
information infrastructure. (2)from self-archiving to automated submission or ingestion. (3) from independent platforms to cur- 
rent research information system( CRIS) . (4) from scholarly outputs management platform to academic resources service cen- 
ter. from information retrieval to supporting big data and semantic retrieval. (6)from academic archives to academic 
scholarly communities. (from providing metrics and altmetrics services to creating a new system of academic evaluation. 
next generation repository key technology devel- 
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